Selection - Preprocessing - Transformation - Data Mining - Interpretation/Evaluation
②
Preprocessing - Selection - Transformation - Data Mining - Interpretation/Evaluation
③
Selection - Transformation - Preprocessing - Data Mining - Interpretation/Evaluation
④
Preprocessing - Transformation - Selection - Interpretation/Evaluation - Data Minin
12.
전체 학생 중 한명을 뽑았더니 사과를 좋아할 확률은?
①
4/10
②
3/5
③
1/2
④
3/10
13.
CRISP-DM의 업무이해 단계로 맞는 것은?
①
업무 상황파악 - 데이터 마이닝 목표설정 - 프로젝트 계획 수립
②
데이터 마이닝 목표설정 - 프로젝트 계획 수립 - 업무 상황파악
③
프로젝트 계획 수립 - 업무 상황파악 - 데이터 마이닝 목표설정
④
업무 상황파악 - 프로젝트 계획 수립 - 데이터 마이닝 목표설정
14.
4V에서 비즈니스 효과에 해당하는 것은?
①
Value
②
Volume
③
Velocity
④
Variety
15.
프로세스 내재화에 대한 설명 중 분석 결과를 활용하고, 혁신 및 성과 향상에 기여하는 것은?
①
도입
②
활용
③
확산
④
최적화
16.
상향식 방법론으로 옳지 않은 것은?
①
문제정의를 명확히 할 수 있을 때 사용한다
②
데이터 중심의 접근방식이다
③
데이터를 통해 인사이트를 도출한다
④
탐색적 분석이 중심이 된다
17.
분석과제에서 고려해야할 요소가 아닌 것은?
①
데이터 크기(규모)
②
속도
③
복잡도
④
데이터 분류
18.
시급성이 현재일 때 가장 먼저 고려할 것은?
①
전략적 중요도
②
실현 가능성
③
데이터 확보 용이성
④
분석 난이도
19.
데이터분석 준비시 고려의 중요도가 가장 낮은 것은?
①
비용
②
분석업무이해
③
분석문화
④
분석기법
20.
협의의 데이터플랫폼의 구성요소인 것은?
①
분석 어플리케이션
②
분석 서비스 제공 API
③
분석 라이브러리
④
분석 서비스 엔진
데이터 분석
21.
분석 방법은 알고 대상은 모를 때 사용할 수 있는 방법은?
①
발견
②
통찰
③
최적화
④
솔루션
22.
회귀모형 선택방법에 대한 설명 중 틀린 것은?
①
AIC는 모형의 적합도와 복잡성을 고려한다
②
R-제곱은 설명력을 나타내는 지표이다
③
조정된 R-제곱은 변수 수를 고려한다
④
BIC는 베이즈 정리에 기반하여 복잡한 모형에 더 큰 페널티를 부여한다
23.
혼합분포군집에서 사용하는 알고리즘은?
①
EM 알고리즘
②
K-means
③
계층적 군집화
④
DBSCAN
24.
TV-라디오 R코드 해석 문제
①
TV와 라디오 사이의 교호관계가 있어 통계 모형이 유의하다
②
TV:radio 통계 모형이 유의하다
③
TV가 1 증가할 때 RADIO와 상관없이 SALES가 오른다
④
모형의 설명력은 약 67%이다
25.
분해시계열 요인 중 옳지 않은 것은?
①
추세요인
②
계절요인
③
교호요인
④
순환요인
26.
다음 중 지도학습이 아닌 것은?
①
로지스틱회귀분석
②
의사결정나무
③
인공신경망
④
SOM
27.
회귀방정식 탐색방법 중 잘못된 것은?
①
후진선택법은 상수항만 남을때까지 제거한다
②
전진선택법은 변수를 하나씩 추가한다
③
단계적 선택법은 변수를 추가하거나 제거할 수 있다
④
모든 가능한 회귀는 모든 조합을 검토한다
28.
앙상블기법이 아닌 것은?
①
시그모이드
②
배깅
③
부스팅
④
스태킹
29.
이상치를 이용하기에 가장 적절한 시스템인 것은?
①
부정구매 방지시스템
②
추천시스템
③
수요예측시스템
④
고객분류시스템
30.
매우만족 - 만족 - 보통 - 불만 - 매우 불만족은 무슨 척도인가?
①
서열척도
②
명목척도
③
구간척도
④
비율척도
31.
의사결정트리에서 범주형 변수에서의 분할방법에서 사용하는 것으로 옳지 않은 것은?
①
카이제곱 통계량
②
지니지수
③
엔트로피지수
④
분산감소량
32.
주장하고자 하는 가설이 실제로는 예상보다 이상값이 도출될 확률이 높은 것은?
①
알파
②
P-value
③
베타
④
1-알파
33.
다음에서 t통계량을 계산하시오
①
2.348 / 0.312 (회귀계수 / 오차)
②
0.312 / 2.348 (오차 / 회귀계수)
③
2.348 * 0.312 (회귀계수 * 오차)
④
(2.348 + 0.312) / 2
34.
다음 표로부터 오분류율을 계산하시오.
①
13/20 = (FP + FN)/전체 = (8 + 5)/20 = 0.65
②
(TP + TN)/전체 = (2 + 5)/20 = 0.35
③
TP/(TP + FP) = 2/(2 + 8) = 0.2
④
TN/(TN + FN) = 5/(5 + 5) = 0.5
35.
보기의 내용을 통해 도출한 A질병 진단받은 사람 중 A질병 가진 사람 비율은?
[보기]
- 전체 중 A질병 가진사람: 10%
- 전체 중 A질병 진단받은 사람: 20%
- A질병 진단받은 사람 중 A질병을 실제 가진 사람: 90%
①
1/9
②
2/9
③
9/20
④
9/10
36.
결측값에 대한 설명 중 틀린 것은?
①
완전연결법은 결측값 데이터를 완전히 삭제한다
②
다중대치법은 여러번 대치하여 여러개의 자료를 도출한다
③
확률단순선택법은 회귀분석을 사용한다
④
평균표준편차는 중앙값으로 대체한다
37.
군집분석에서 군집수를 결정하는 방법은?
①
엘보우방법
②
상관계수
③
유클리드거리
④
맨하탄거리
38.
모집단이 정규분포를 따를때 신뢰구간 95%가 다음과 같이 계산된다. 이중 틀린 설명은?
0.5 ± 1.96 / √100
①
신뢰구간 99%로 변경시 1.96대신 2.58이다
②
표본평균이 0.5이다
③
모집단의 평균값이 신뢰구간에 포함되지 않을 수 있다
④
동일한 모집단에서 같은 방식으로 표본을 추출하고 같은 방식으로 신뢰구간을 추정하면 동일한 값이 나온다
39.
DBSCAN 관련하여 틀린 것은?
①
임의 형태의 군집으로 분류하는데 유용하다
②
밀도기반 군집화 알고리즘이다
③
초기 군집수 k를 설정해야한다
④
다차원 자료의 경우 '차원의 저주'로 인해 유용하지않다
40.
인공신경망관련 설명 중 틀린 것은?
①
은닉층이 적으면 과대적합, 은닉층 많으면 과소적합
②
은닉층이 많을수록 복잡한 패턴을 학습할 수 있다
③
활성화함수는 비선형성을 부여한다
④
과적합을 방지하기 위해 드롭아웃을 사용할 수 있다
41.
신용카드 고객의 파산확률을 yes, no로 예측하기에 적절하지 않은 방법은?
①
선형회귀분석
②
로지스틱 회귀분석
③
랜덤포레스트
④
SVM
42.
의사결정트리에서 더이상 세분화하지않고 멈출때 사용하는 기법은?
①
정지규칙
②
가지치기
③
비용복잡도
④
교차검증
43.
다중공선성 해결방법으로 옳지 않은 것은?
①
중요도가 낮으면서 상관계수가 높은 변수를 제거한다
②
구조적 다중공선성의 문제가 있는 경우에는 데이터의 평균 중심을 변화한다
③
주성분분석을 통해 차원을 축소한다
④
VIF를 이용하여 다중공선성 유무를 판단한다
44.
다중회귀모형에서 통계적으로 유의함을 판단할때 사용하는 검증은?
①
F검정
②
P-VALUE
③
T통계량
④
Z통계량
45.
데이터 베이스의 특징 중 ( ) 안에 들어갈 내용으로 알맞은 것은?
1. ( )데이터는 동일한 내용이 중복되지않게 함
2. ( )데이터는 컴퓨터가 접근할 수있는 매체에 저장
3. ( )데이터는 여러 사용자가 함께 사용가능
4. ( )데이터는 항상 변화해도 현재의 정확한 데이터를 유지해야함
①
공용 - 저장 - 통합 - 변화되는
②
저장 - 통합 - 공용 - 변화되는
③
통합된 - 저장 - 공용 - 변화되는
④
통합된 - 공용 - 변화되는 - 저장
46.
이상값에 대한 설명 중 틀린 것은?
①
범위의 경우 이상값 존재시 값이 커진다는 단점이 있다
②
평균대치법에는 조건부 평균대치법, 비조건부 평균대치법이 있다
③
이상값은 데이터의 품질을 저하시킬 수 있다
④
평균절대편차법은 중앙값이랑 변수 사이의 차이값들로 이루어진 것을 의미한다
47.
자기상관모형에 대한 설명으로 맞는 것은?
①
ARIMA는 비정상 시계열에만 사용한다
②
MA(q)는 과거의 관측값에 의존한다
③
계절성 ARIMA는 주기성을 고려하지 않는다
④
AR(1)은 1개의 시차, AR(2)는 2개의 시차 사용한다
48.
회귀모형의 가정에 대한 설명으로 옳은 것은?
①
잔차는 서로 독립이어야 한다
②
설명변수 간에는 높은 상관관계가 있어야 한다
③
잔차의 분산은 불균일해야 한다
④
잔차는 비정규분포를 따라야 한다
49.
A를 선택할 확률 대비 B와 A를 같이 팔 때 얼마나 더 많이 팔리는가?
①
지지도
②
신뢰도
③
향상도
④
재현율
50.
apriori 알고리즘에 대한 설명으로 옳은 것은?
①
순차적 패턴을 찾는데 사용된다
②
군집분석에 주로 활용된다
③
최소 지지도를 가정으로 한다
④
연속형 변수에만 적용 가능하다
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
채점하기
hide
reset
타이머
정보보안기사 복구 문제의 한계
정보보안기사는 기출문제를 공개하지 않는 시험입니다.
본 사이트에 수록된 문제들은 기출문제와 유사하게 복구된 것이며 기출문제와 정확히 일치하지 않습니다. (이 부분은 다른 모든 사이트 및 정보보안기사 수험서 또한 마찬가지 입니다.)
문제들 중 일부는 위키나 블로그 등을 참조하여 직접 복구하고 일부는 웹상에서 복구된 문제를 수집하여 재정리하였습니다. 만약 복구 문제에 본인이 직접 만든 그림, 본인이 직접 작성한 문장 등이 그대로 사용되어 조치를 원하시는 경우 연락주시면 지체 없이 처리하도록 하겠습니다.
시험 결과
데이터분석 준전문가 42회
채점 중입니다..
축하드립니다! 합격입니다!
불합격입니다.
점수 0점
( 0 / 0 )
소요 시간: O분O초
과목 명
문제수
맞춘문제
환산점수
0점 이상 합격, 각 과목당 0점 미만 과락입니다. 풀지 않은 문제는 틀린 것으로 간주합니다. 부분 정답(△표시)는 참고사항을 위해 보여드린 것으로, 점수로 인정하지 않습니다.
모든 문제들의 저작권은 원저작권자에게 있습니다. 본 사이트는 웹상에 공개되어 있는 문제만 모아서 보여드립니다. 저작권 안내데이터 보호 안내제휴 문의